Le jeu de données « Bâtiments de Troyes Champagne Métropole » recense l’ensemble des bâtiments situés dans l’agglomération Troyes Champagne Métropole, à des fins variées telles que l’urbanisme, l’aménagement du territoire, les analyses foncières ou encore la gestion des services publics. Il a été publié en août 2024 sur la plateforme data.gouv.fr.
Ce jeu de données provient de l’unification des bases BDTOPO® et BD PARCELLAIRE® de l’IGN. Il comprend 107 946 observations, avec très peu de valeurs manquantes, ce qui en fait une base fiable et complète pour l’analyse spatiale.
Nous avons choisi ce jeu de données, car il nous semble pertinent d’étudier la répartition géographique des bâtiments dans la ville de Troyes. Afin d’enrichir notre analyse, nous avons décidé d’y associer un second jeu de données : la Base Adresse Nationale (BAN), qui recense les adresses géolocalisées des bâtiments sur l’ensemble du territoire français (nous utiliserons uniquement les adresses du département nous concernant).
La base de données bâtiments est disponible ici. Ce jeu de données a été commandé par “Troyes Champagne Métropole” et a été mise à jour dernièrement en août 2024 dans le but de regrouper les entités géographiques de la métropole troyenne. Les données proviennent elles-mêmes de deux sources différentes qui ont été fusionnées : BDTOPO® et BD PARCELLAIRE®, les deux étant produits par IGN.
Et la base de données des adresses, un csv par département, est ici (adresses-10.csv que nous avons renommé adresses_aube.csv). Les données proviennent de la BAN. Ces données sont initialement destiné aux services d’urgence pour qu’ils puissent se diriger. Elle est aussi destiné au raccord aux réseaux d’énergies ou de communication ou encore pour des analyses cartographiques précises. Sa constitution est copilotée par l’ANCT, la DINUM et l’IGN.
Les liens, quant à eux sont disponibles sur ce lien. Produits aussi par IGN, c’est une base de données qui permet de lier la BAN à son environnement géographique.
Dans notre étude, nous allons considérer 16 variables.
Nous avons sélectionné 14 variables dans le premier jeu de données.
| Nom | Type | Description |
|---|---|---|
| NATURE | nominal | architecture du bâtiment |
| USAGE1 | nominal | utilisation du bâtiment (agricole, résidentiel, religieux…) |
| USAGE2 | nominal (optionnel) | utilisation du bâtiment |
| LEGER | discrète | structure légère ou pas |
| DATE_APP | discrète | date d’apparition/construction (pas toujours présent) |
| ACQU_PLANI | nominal | de quelle base provient l’information |
| NB_LOGTS | discrète | nombre de logements dans le bâtiment |
| NB_ETAGES | discrète | nombre d’étages du bâtiment |
| MAT_MURS | discrète | code des matériaux des murs (à croiser avec le csv materiaux_murs.csv) |
| MAT_TOITS | discrète | code des matériaux de la toiture (à croiser avec le csv materiaux_toits.csv) |
| HAUTEUR | continue | hauteur du bâtiment |
| Z_SOL | continue | altitude du sol |
| Z_TOIT | continue | altitude du toit |
| ETAT | nominal | état du bâtiment (en projet, en construction, en service, en ruine) |
Pour la localisation, nous utiliserons 2 variables : la longitude et la latitude.
| Nom | Type | Description |
|---|---|---|
| LONGITUDE | continue | coordonnée GPS |
| LATITUDE | continue | coordonnée GPS |
Nous avons enlevé les variables qui nous semblaient inutiles ainsi que celles comportant peu de valeurs. Nous avons aussi enlevé les variables que nous n’avons pas trouvées pertinentes.
Il s’agit ici de déterminer s’il existe une relation entre les
variables date_app, mat_murs et
mat_toits. L’objectif est de vérifier si les matériaux de
construction des bâtiments varient en fonction des époques.
Pour cela, nous envisageons deux types de visualisations :
Un line chart pour suivre l’évolution du nombre de bâtiments par matériau au fil du temps :
Un violon plot pour étudier la distribution des dates selon chaque matériau :
Les problèmes potentiels sont :
L’objectif ici est de comprendre si l’évolution des matériaux a un
impact sur la hauteur des bâtiments. Nous aimerions comparer la
distribution des hauteurs en fonction des matériaux et vérifier si
certains matériaux sont associés à des hauteurs spécifiques. Nous
utiliserions de nouveau les variables mat_murs et
mat_toits que nous mettrions en relation avec la variable
hauteur.
Pour cela, nous envisageons d’utiliser :
L’objectif ici est de déterminer si certains types d’usage des
bâtiments sont spécifiquement localisés dans certaines zones de la ville
de Troyes. Pouvons-nous identifier des zones résidentielles, des zones
industrielles et des zones commerciales ? Nous utiliserons les variables
de coordonnées géographiques (longitude et
latitude) et les variables usage1 et
usage2.
Pour cela, nous envisageons :
Les problèmes potentiels :
Il s’agit de déterminer s’il existe une relation entre la hauteur
d’un bâtiment et son usage. Les variables utilisées sont : la variable
hauteur et la variable usage1.
Pour cela, nous envisageons d’utiliser :
Hypothèses: Ces visualisations nous permettront de voir la distribution des bâtiments en fonction des matériaux utilisés pour les murs et les toits. On pourrait identifier les matériaux les plus utilisés et trouver les raisons pour les quelles ces matériaux sont aussi utilisés.
Graphe:
Pour cela, nous allons faire des barplots.
On utilisera les variables matériaux murs.
On constate que les matériaux les plus utilisés pour les murs sont les briques et l’aggloméré.
On utilisera les variables matériaux toits.
On constate que le matériau le plus utilisé pour les toits est les tuiles.
L’objectif est de voir la distribution des bâtiments en fonction de la hauteur des bâtiments.
On remarque que la plupart des bâtiments ont une hauteur située entre 0 et 10m.
L’objectif est de voir la distribution des bâtiments en fonction de l’année de construction.
##
## Attachement du package : 'lubridate'
## Les objets suivants sont masqués depuis 'package:base':
##
## date, intersect, setdiff, union
Il s’agit de déterminer s’il existe une relation entre la hauteur
d’un bâtiment et son usage. Les variables utilisées sont : la variable
hauteur et la variable usage1.
Résultats attendus :
Nous pensons que :
Les bâtiments résidentiels seraient majoritairement de petite ou moyenne hauteur
Les bâtiments à usage commercial ou industriel pourraient être de hauteur élevée
On remarque que la plupart des bâtiments ont une hauteur inférieure à 10 m. Cela peut être lié au fait que la ville de Troyes n’a pas subi une urbanisation dense. Ensuite, on remarque que la plupart des bâtiments sont à usage résidentiel.
Contrairement à l’hypothèse de départ, la plupart des bâtiments à usage commercial ont une hauteur inférieure à 10 m. Cela s’explique par le fait que les commerces sont intégrés en rez-de-chaussée des bâtiments résidentiels.
Nous voulons voir si les bâtiments si les bâtiments ont été
construits de plus en plus loin du centre de Troyes au fil des années ou
si cela a peu d’influence.
Les variables utilisées sont : date_app,
longitude et latitude.
Nous pensons que :
Les bâtiments dans le centre sont les plus vieux
Il y a des vieux bâtiments aussi autour de Troyes
Il est difficile de connaître la date de construction des bâtiments qui ont été construits avant 1600, d’où le manque d’information. J’ai dû masquer tous les bâtiments dont on a pas la date de construction car cela nuisait à la lisibilité du graphique.
On remarque la construction de beaucoup de bâtiments entre 1700 et 1800, puis une assez grosse expansion entre 1800 et 1900. On remarque aussi que l’agglomération de Troyes avait sa forme assez tôt et que même si elle s’est densifiée, elle ne s’est pas vraiment étendue.
L’objectif ici est de comprendre si l’évolution des matériaux, principalement des murs a un impact sur la hauteur des bâtiments. Pour cela, nous allons réaliser deux violinplot, l’un lié au matériau des murs et l’autre des toits afin de confirmer une corrélation.
Les variables utilisées sont :
MAT_MURS : variable nominale : code des matériaux des murs, croisé avec materiaux_murs.csv
MAT_TOITS : variable nominale : code des matériaux de la toiture, croisé avec materiaux_toits.csv
HAUTEUR : variable continue représentant la hauteur absolue du bâtiment
Nous nous attendons à ce que les matériaux plus modernes et denses comme le béton ( au niveau des murs et aussi de la toiture ) composent les bâtiments les plus hauts de l’agglomération troyenne. De, plus nous pensons que le matériau des murs aura plus d’influence que celui de la toiture.
## Warning: Groups with fewer than two data points have been dropped.
Tout d’abord, quand l’on regarde le graphique de la hauteur par rapport aux matériaux des murs, il est difficile d’observer une corrélation. En effet, on remarque de très faibles différences dans la distribution des hauteurs pour chaque combinaison de matériau. Cela pourrait amener à penser que le matériau des murs n’a pas une influence déterminante sur la hauteur des bâtiments, du moins d’après cette visualisation. Une approche complémentaire, comme représenter la hauteur moyenne ou médiane pour chaque matériau, pourrait nous apporter des réponses plus claires et mettre en évidence des tendances qui peuvent être plus légères.
Cependant, quand l’on observe le graphique lié à la hauteur des bâtiments selon le matériau de la toiture, on peut clairement observer que les matériaux ZINC ALUMINIUM, BETON et ARDOISES recouvrent les bâtiments les plus hauts, alors que les TUILES ne dépassent que très rarement la dizaine de mètres de hauteur. Cela indique une possible corrélation entre le type de matériau utilisé pour la toiture et la hauteur des bâtiments.
En conclusion, la question est partiellement répondue et les résultats diffèrent sensiblement de nos attentes initiales. On remarque une corrélation significative entre les matériaux de toiture et la hauteur des bâtiments, alors que celle entre les matériaux des murs et la hauteur est beaucoup plus difficile à établir sans pour autant pouvoir l’écarter du champ des possibilités. Cela soulève donc une nouvelle question : pourquoi le matériau de la toiture semble-t-il mieux refléter la hauteur d’un bâtiment que celui des murs ?
L’objectif ici est de comprendre si l’utilisation des matériaux changent salon les époques. Pour cela nous allons réaliser un violinplot lié matériau des murs.
Les variables utilisées sont :
MAT_MURS: variable nominal: code des matériaux des murs, croisé avec materiaux_murs.csv
DATE_APP: variable discrète d’apparition des bâtiments
Nous nous attendons à ce que les matériaux les plus solides de chaque époque soit utilisés successivement.
## Warning: Removed 51774 rows containing non-finite values (`stat_ydensity()`).
Tout d’abord, il faut préciser que nous manquant de beaucoup d’information, particulièrement sur les années avant 1800. Il est donc impossible de généraliser les informations du graphe. De plus, un certain nombre de bâtiments n’ont pas de matériaux connus. Nous passons donc de 107 946 observations à 59097 observations. Cependant, nous pouvons voir des tendances se dégager. Certains matériaux sont présent depuis avant 1600, comme l’aggloméré et le bois. D’autres ont connu des pics de popularité récents, comme le béton, la brique et l’aggloméré. On peut aussi remarqué l’utilisation massive de la pierre autours des années 1900 mais s’est raréfié depuis. Même si certains matériaux s’imposent à certaines époques, on peut voir qu’il y a une diversité de ceux-ci et beaucoup de mélange de matériaux.
Pour aller plus loin, on aurait pu faire le même graphique mais en ayant une distribution des matériaux par période en pourcentage, ce qui éviterait “l’écrasement” des données plus anciennes et moins nombre, mais ferait perdre du détail sur la chronologie.
1. Comment la ville de Troyes s’est étendue géographiquement au fil des années ?
Il s’agit ici de visualiser l’évolution spatiale de la ville de Troyes au fil du temps. Pour cela, nous utiliserons la variable
date_appet les variables de coordonnées géographiques :latitudeetlongitude.Comme types de visualisations à envisager, nous avons :
Les problèmes potentiels :